解放军总医院医疗大数据中心主任薛万国应邀撰文,剖析了当前医学人工智能的应用现状和面临的主要挑战,并提出了相关建设性思考。
薛万国:如何看待当前医学人工智能应用的现状和挑战
过去一段时期内,业内在医学人工智能领域展开了很多应用实践,包括我院也做了一些探索和尝试,显示了人工智能在医学领域具有很大的潜力。但是总体来看,医学人工智能并不能替代医生,而且现阶段的落地范围还是呈散点式、单一式的应用。
医学人工智能应用现状
我们先来看一些当前医学人工智能应用的典型例子:
一是目前已经实现的CDSS(临床辅助决策系统)的落地应用,主要基于医学知识图谱和临床规则,具有较大的适用疾病谱系。比如,在门诊就医时输入肥胖、多尿、贪食等患者主诉,根据这些症状描述,系统就可以疑似诊断为二型糖尿病。由于医学知识图谱和临床规则在底层支撑了症状和疾病的关联,在确定为糖尿病后,系统还能推荐下一步检查项目、用药等诊治选择。
二是基于大数据建模型做鉴别诊断,这与医学知识图谱和临床规则不同。比如,我院急诊科提出一个需求:在急诊胸痛患者里,有三类疾病的死亡率非常高,分别是急性冠脉综合征、肺栓塞和主动脉夹层。其中,急性冠脉综合征和主动脉夹层在临床上的症状表现很相似,但两种疾病的治疗方法完全不同。如果仅根据症状描述很难做出鉴别诊断,所以通常的传统方法是进行造影检查,但造影时间比较长而且还有创伤,可否仅根据容易快速获得的化验结果进行鉴别诊断。根据此需求,我们做了一个尝试。就是根据既往两类病例的化验结果数据建立一个机器学习模型进行训练,发现可以有较好的分类表现。将这一模型嵌入到医生工作站,就可以使得医生工作站具备人工智能的辅助诊断能力。
三是疾病风险预测。比如一部分糖尿病患者可能会发生视网膜病变。那么,是否能根据某些检查指标或生命体征数据来预测患者发生视网膜病变的可能性呢?我院基于2万多例糖尿病患者的数据建立了一个模型,找到了预测视网膜病变的主要风险因素,包括某些化验结果、年龄、生命体征等指标。
四是在医学影像方面。比如,我院展开了针对肝脏肿瘤的影像识别研究。首先基于CT影像采用深度学习方法进行肝脏分割,进一步将肝脏自动模拟人工方法分成八段,在此基础上进行肿瘤识别和部位标注,最后用于辅助诊断和手术方案的评估。
五是皮肤病理图像的识别研究。我院开展的研究是针对皮肤的黑色素瘤,主要通过人工标注后训练机器自动识别病理切片是否包含皮肤黑色素瘤的细胞。经过测试,我们发现目前机器标注和人工标注的重合度已经非常高,超过了普通医生对黑色素瘤的诊断水平。
六是临床智能输血决策系统。我院基于8万多例输血病例建立红细胞输注量个性化预测评估模型,并将该模型嵌入医生工作站。在手术输血的申请模块增加一个功能键,实现医生输血申请的智能化管控,以防止过量或不必要的输血。
一是,目前每个应用都只是针对临床上的单一问题或针对单一疾病。一个训练好的模型只能应用于一个问题。比如,针对肺结节所训练的模型只能识别肺结节,如果要识别肺结核或者肺炎则需要再去训练新模型。因此,目前医学人工智能的应用主要还是针对特定的疾病或特定的问题。
二是,当前应用的热点是医学影像识别和自然语言处理。其中,医学影像识别主要集中在肺结节、眼底影像、消化内镜、乳腺影像、病理影像等方面。而在自然语言处理方面,主要通过医学知识图谱和临床知识库,来实现医生诊疗路径选择和病案质控等方面的智能化应用。
三是,在技术方面,目前使用比较多的技术有两种:一是深度学习;二是医学知识图谱。但目前人工智能所使用的特征信息相对单一和局限,还缺乏多模态、多来源数据的综合应用。比如,上面提到的鉴别诊断就是根据化验结果,而目前应用较多的肺结节影像诊断也只是针对局部影像。
从以上应用也可看出,人工智能确实已经在医疗领域有了很多实践,也显示出了很大潜力。但另一方面,这些进展并不能说明人工智能在医学影像、疾病辅助诊断、疾病风险预测等方面就可以代替医生。而且,正是因为这些案例才使我们更清醒地认识到,医学人工智能的应用还有非常大的挑战。
医学人工智能面临的四点挑战
从医学人工智能的应用成熟度上看,目前有很多研究成果或论文都已经发表,同时也有很多测试和比赛。但总体而言,真正落地应用的案例还比较少,极少有项目最终转化为临床应用。比如,在前文所述的几个实践中,目前在我院真正实现临床落地的应用也只有智能输血决策系统,其他模型暂时还没有经过临床落地考验。
目前,医学人工智能面临四个方面的挑战。
首先在技术方面,机器学习和深度学习的方法本身具有很大局限性。
(1)基于学习的方法需要大量人工标注。采用规则的方法是医生把临床知识经过总结后表达给机器,机器采取演绎推理的方法实现人工智能应用;而基于学习的方法需要机器自动总结归纳,是在事实中学习的模式和规律,所以需要投入大量的人工标注来反复测试和改进,工作量很大。
(2)学习方法的功能还较为单一。每种疾病的图像模式都不一样,不同类型的问题都需要重新学习。
(3)机器学习与医生相比,缺乏很多生理、病理等方面的理论知识,完全基于文字表达和事实总结进行推导。
(4)机器缺乏对不同来源信息的综合利用,目前还远远达不到医生的综合判断能力。举个肺癌诊断的例子,现在医院对于肺癌患者的诊断首先是基于影像学诊断,一般早期的肺结节或阴影都会被发现。如果要进一步确诊,还需进行穿刺检查。但医生考虑穿刺的创伤和难度也会建议患者消炎半个月后再做一次CT影像检查作对照,如果阴影缩小就是炎症,如果没变化则是肿瘤,无论恶性、良性都需要手术切除。诸如此类的医生综合判断规则,目前机器并不能学习和掌握。换言之,医生可以从多方面和多角度出发去参考和判断,但今天的人工智能还不具备这种能力。
(5)医学知识图谱也有很大局限性。首先,医学知识图谱表达的是字面上的关联,是一种通过图谱的形式表达出来的实体与实体之间的相互关系。由于医疗知识的复杂性以及更新变化较多,导致很难将所有疾病形成综合的医学知识图谱。所以,基于知识图谱来模拟医生诊断过程将非常困难。
其次是数据方面的挑战。由于机器学习依赖大量数据,但高质量的数据非常缺乏,这严重影响了模型的训练。比如,现在大量的病例没有随访结果作对照,往往都无法判断诊疗方法是否最佳、诊断是否准确,而且院外数据的缺失也导致不足以支撑训练模型。
第三是应用方面的挑战。为什么很多研究成果都没能实现落地应用?主要存在以下几点问题。
(1)很多研究成果很难融入到实际工作流程中。散点式的功能很难形成统一的工作流程。比如,现在已经有了针对急诊胸痛患者的鉴别诊断模型,但急诊科每天面对的是很多不同类型的疾病。
(2)系统集成不到位,大量模型还游离在业务之外。不同疾病模型的使用环境都不同,为了避免把医生工作站改造得“支离破碎”,需要建立统一的集成规范解决问题。
(3)测试环境和实际环境还有较大差距。比如,某类疾病模型的诊断识别率在测试或比赛时能达到95%,但应用到临床时,马上会下降至70%甚至更低。这是由于实际环境远比测试、比赛环境复杂,临床围绕的是完全未知的数据集,两者不能相比。
(4)低水平的智能化应用增加了人工打扰,反而造成了很多应用不被临床所接受。比如,前文提到的基于知识图谱的CDSS临床辅助系统,大部分提示对于大医院的医生而言并不需要。而且从目前反馈来看,在中小医院里的应用效果也并不太好。
第四是在法规方面也面临很大挑战。原来医生一直把临床指南作为诊断的“金标准”,即使出现意外或风险也无需承担太多责任,毕竟个体有差异。但是,比如针对急诊胸痛患者鉴别的人工智能应用,即使其诊断识别率能达到98%。但是临床指南的“金标准”要求患者进行造影检查。如果不做造影检查而恰恰出现了2%的差错,那么此时医生就要担责。此外,医学人工智能应用产品目前大多还缺乏认证机制,产品良莠不齐,要保证产品本身的质量,需要进行相关的第三方的测试和第三方验证。
如何看待当前医学人工智能的发展
首先,目前医学人工智能仍处于初步发展阶段,距离广泛应用还有很大距离。对医学人工智能应用应该抱有一个合理期待,要选择能够落地的项目去实施。
其次,要在技术成果的工程化和转化应用上面“下功夫”。要加强系统集成和流程改造,把现有业务系统进行升级,探索更多能将研究成果落地应用的方法。
再次,要在研发中注重结合多模态、多源数据的融合和综合分析。单一数据特征的价值十分有限,医生最擅长的也是综合判断能力。
最后,在一些单点问题上要突出医学人工智能产品和应用的独特价值。不能单纯地追求在较宽的面上具备“模仿”医生的功能,而是要在具体某一点上达到或超过医生的能力。
我们要时刻思考医学人工智能的实用价值到底在哪里?不能仅仅为“智能”而智能,要避免医学人工智能应用沦为“玩具”或“鸡肋”。因为很多“玩具类”功能非但起不到任何实际价值,还对医生形成很多干扰。这也是今天医学人工智能应用面临的最大问题之一。
HIT专家网∣致力推进中国卫生信息化
想加入HIT专家网专业交流群吗?
请添加“HIT专家网”小助手微信好友
(请务必注明姓名、单位名称、职务、主管技术或产品领域等实名信息)
微信订阅号:HIT180com
微信服务号:chinaHIT
投稿:tan_xiao@hit180.com
商务合作:(010)82373062